Language Model for Dialogue Applications

略 : LaMDA

MUM (Multitask Unified Model) により、テキストに限らないマルチモーダル (画像や音声) な学習により、「夕日が綺麗な海岸のルート」などの指示も可能

動画内のシーン検索をテキストで行うことが可能に

参考文献